transformer

Sora 2来袭 颠覆AI行业|通讯Plus·深度

美国当地时间9月30日,OpenAI正式发布其新一代视频生成模型Sora 2,该模型在画面、物理逻辑实现跨越式突破。与此同时,OpenAI在苹果应用商店App Store美国区上线了将Sora 2与社交功能集于一身的App——Sora。短短4天,该App登顶美

模型 openai 行业 transformer sora 2025-10-09 08:13  9

中国AI产业2024年规模超9000亿!5300家企业占全球15%,三层体系筑牢发展根基

2024年中国人工智能产业迎来爆发式增长,核心产业规模首次突破9000亿元大关,较上年实现24%的高速增幅,这一数据来自中国信息通信研究院在2025人工智能产业及赋能新型工业化大会上发布的权威测算。截至2025年9月,国内AI企业数量已突破5300家,在全球近

企业 文心 transformer 应用层 基础层 2025-10-05 05:44  9

新的人工智能研究声称越来越接近模拟人类大脑

在人工智能以前所未有的速度席卷全球之际,一个根本性的矛盾正日益凸显:科技巨头们正准备投入数万亿美元,加速一场基于我们尚不完全理解的技术的竞赛。当前的大型语言模型(LLM)如同一个深邃的“黑箱”,其内部运作逻辑的模糊性,已成为阻碍人工智能在医疗、金融等高风险领域

研究 人工智能 llm transformer 幼雏 2025-10-03 20:43  9

GPT系列模型的工作原理

GPT(Generative Pre-trained Transformer)系列模型是基于Transformer 架构的生成式大语言模型,核心逻辑可拆解为 “预训练 - 微调” 两大阶段,通过 “理解语境 - 预测下一个词” 的方式实现自然语言生成,以下从技

模型 gpt transformer 向量 token 2025-09-30 15:21  7

破译古籍密码,HisDoc-DETR论文解读

在数字人文与历史研究领域,浩如烟海的古籍文献是宝贵的文化遗产。然而,如何让计算机自动“读懂”这些布局复杂、版式多变的古籍,精确地识别出其中的标题、段落、注释、插图等元素,一直以来都是一个巨大的挑战。传统的深度学习方法(如 Faster R-CNN 、YOLO

论文 transformer 双流 古籍 giou 2025-09-27 20:11  9

生成式 Transformer 模型 Delphi-2M:医疗健康的预测与决策范式

医疗保健的核心使命在于通过解析个体健康轨迹的过去与现在,精准预测未来风险并实施干预。人工智能技术的崛起为这一使命提供了新的解决方案,尤其在从海量健康数据中挖掘疾病进展规律方面展现出巨大潜力。然而,传统 AI 模型往往受限于单病种预测框架,难以应对人类疾病的复杂

模型 范式 预测 transformer 医疗健康 2025-09-25 14:28  8

自动驾驶中常提的VLM是个啥?与VLA有什么区别?

自动驾驶车辆要在复杂多变的道路环境中安全行驶,不仅需要“看见”前方的车辆、行人和路面标志,还需要“读懂”交通标识上的文字提示、施工告示牌和乘客的语言指令。之前和大家讨论过VLA(相关阅读:自动驾驶中常提的VLA是个啥?),了解到视觉-语言-动作模型,但在很多场

模态 transformer vla 自然语言 vlm 2025-09-24 04:46  9

当算法不再&

这项由独立研究者Rishiraj Acharya完成的创新研究发表于2025年8月的arXiv预印本平台(论文编号:arXiv:2509.00605v1),有兴趣深入了解的读者可以通过该编号在arXiv网站上访问完整论文。这位研究者独自开发了一种全新的人工智能

算法 transformer mamba gam achar 2025-09-23 15:36  8